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摘要 : [目的 /意义 ] 笔 者 在 江苏 省 工程 文献 信息 中 心平 台 承担 文献 传递 工作 ， 其 中 机 械 重 复 
的 操作 占 比 很 大 ， 严 重 侵占 了 工作 时 间 。 而 且 文献 需求 是 24 小 时 的 ， 作 为 值班 馆 员 只 能 在 
有 限 的 时 间 来 进行 传递 ， 传 递 时 效 性 难以 得 到 保证 。 所 以 ， 笔 者 尝试 开发 一 个 文献 传递 机 
器 人 ， 自 动 化 实现 完成 文献 传递 工作 。 [方法 /过 程 ] 论文 以 江苏 省 工程 文献 信息 中 心平 台 
为 例 ， 基 于 Selenium 框架 ， 设 计 开 发 文献 传递 机 器 人 ， 实 现 登 录 、 答 到， 获取 订单 、 检 索 、 
下 载 、 上 传 ， 完 成 文献 传递 后 再 继续 等 待 派 单 的 全 过 程 。 [结果 /结论 ] 通过 一 个 月 的 运行 
分 析 ， 文 献 传 递 机 器 人 虽然 不 能 完全 取代 人 工 传递 ， 但 却 可 以 有 效 解 决 文献 传递 过 程 中 的 
占 比 很 大 的 机 械 重 复 的 工作 ， 提 高 了 传递 效率 ， 同 时 ， 又 拓展 了 服务 时 间 ， 让 传递 馆 员 有 
更 多 的 精力 解决 特殊 文献 等 难 查找 的 文献 。 最 后 ， 文 献 传递 机 器 人 对 文献 传递 领域 和 其 他 
相关 场景 也 有 借鉴 意义 
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Abstract: [Purpose/significance]The author is responsible for document delivery work on 
the Jiangsu Engineering Technology Literature Information Center platform where 
mechanical repetitive operations account for a large proportion, seriously encroaching on 
work time. Moreover, the literature requirement is 24 hours, and as a duty librarian, it can 
only be transmitted within a limited time, making it difficult to ensure the timeliness of 
transmission. So, the author attempts to develop a document delivery robot to automate 
the completion of document delivery work.[Method/process]The paper takes the Jiangsu 
Engineering Technology Literature Information Center platform as an example, based on 
the Selenium framework, designs and develops a document delivery robot which realizes 
the entire process of logging in, checking in, obtaining orders, searching, downloading, 
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uploading, completing literature transfer, and then continuing to wait for 
dispatching.[Result/conclusion]After a month of operation analysis, it was found that 
although the document delivery robot cannot completely replace manual delivery, it can 
effectively solve the high proportion of mechanical repetitive work in the literature delivery 
process, Improve the delivery efficiency, and expand the service time, allowing the delivery 
librarians to have more energy to solve difficult to find literature such as special literature. 
Finally, document delivery robots also have reference significance for the field of document 
delivery and other related scenarios. 

Keywords: Document Delivery; Document delivery robot Selenium; Jiangsu Engineering 
Technology Literature Information Center 


文献 传递 是 指 将 文献 资料 按照 用 户 的 要 求 ， 从 图 书馆 或 其 他 信息 机 构 ， 传 递 给 用 户 的 
一 种 服务 方式 。 文 献 传递 的 方式 有 很 多 种 ， 包 括 邮 和 寄 、 电 子 邮 件 、 在 线 传输 等 。 目 前 ， 文 
献 传递 已 成 为 图 书馆 数字 化 建设 的 重要 组 成 部 分 ， 许 多 高 校 图 书馆 和 公共 图 书馆 都 提供 文 
献 传递 服务 ， 并 且 不 断 加 强 数 字 化 文献 资源 的 建设 和 更 新 ， 对 其 服务 不 断 改进 和 完善 。 


1. 研究 现状 


针对 文献 传递 服务 已 经 有 很 多 相关 的 研究 。 这 些 研究 主要 集中 在 文献 传递 服务 的 模式 、 
流程 、 服 务 质量 等 方面 。2014 年 ， 徐 春 等 在 《基于 抢答 机 制 下 的 联合 参考 咨询 服务 模式 下 
究 》” 中 介绍 了 “江苏 省 工程 文献 信息 中 心平 台 ” 的 服务 模式 和 流程 ， 同 年 ， 徐 春 等 又 在 
《区 域 性 联合 参考 咨询 平台 服务 模式 实证 研究 》 ”中 从 文献 传递 数量 、 用 户 需求 、 资 源 分 
布 、 平 台 运 行 模式 、 馆 员 贡 献 度 等 方面 ， 详 细 介绍 了 “江苏 省 工程 文献 信息 中 心平 台 ” 运 
行情 况 。 

文献 传递 服务 的 质量 是 用 户 最 关心 的 问题 之 一 ， 许 多 研究 集中 在 如 何 提高 文献 传递 的 
响应 速度 和 准确 率 ， 以 及 如 何 增加 用 户 满意 度 和 提高 服务 质量 等 方面 。2014 年 ， 秦 霞 在 
《多 平台 下 文献 传递 用 户 评价 和 用 户 行为 的 研究 》“ 中 对 21 位 资深 文献 传递 员 进行 访谈 ， 
总 结 出 影响 用 户 评 价 的 因素 ， 将 这 些 因素 与 文献 传递 用 户 的 4 类 行为 ( 选择 平台 、 信 息 检 
索 、 提 交 申 请 、 获 取 文 献 ) 对 应 进行 分 析 ， 最 后 为 文献 传递 平台 管理 机 构 提 出 建议 。 
2020 年 ， 陆 铣 等 在 《北京 高 校 馆 际 文献 传递 服务 用 户 兴 趣 关联 研究 》 “中 引入 关联 分 析 控 
掘 技术 对 不 同 专业 用 户 群 体 和 不 同 高 校 用 户 群 体 文献 传递 申请 单数 据 进行 分 析 ， 实 现 有 效 
和 有 针对 性 的 文献 推荐 服务 。2019 年 ， 徐 枫 等 在 《文献 传递 伪 需 求 产 生 的 动因 分 析 及 对 策 
研究 》 “中 探究 文献 传递 伪 需 求 产 生 的 深层 原因 ， 并 提出 减少 文献 传递 伪 需 求 的 对 策 ， 以 
提高 图 书馆 文献 传递 服务 效率 ， 帮 助 用 户 高 效 获取 各 类 文献 资源 。 

随 着 互联 网 技术 的 高 速 发 展 ， 新 技术 层出不穷 ， 许 多 新 技术 应 用 到 文献 传递 服务 中 ， 
不 仅 可 以 提高 服务 的 效率 和 质量 ， 还 可 以 拓展 服务 的 范围 和 深度 。2019 年 ， 朱 玉 强 在 《 微 
信 生 态 下 文献 传递 机 器 人 研发 及 其 应 用 》” 中 利用 微 信 公 众 平台 ， 在 不 搭建 第 三 方 服务 器 、 
不 动用 微 信 高 级 接口 的 前 提 下 ， 开 发 文献 传递 机 器 人 程序 ， 实 现 用 户 只 需 发 送 一 条 消息 即 
可 获取 文献 人 全文。 但是， 诸如 此 类 与 文献 传递 相关 新 技术 应 用 的 研究 还 相对 较 少 ， 所 以 ， 
笔者 尝试 把 Seleniunm 框架 应 用 到 文献 传递 工作 当中 ， 通 过 Python 调用 其 接口 ， 实 现 文 献 
传递 服务 的 自动 化 。 


2. 江苏 省 工程 文献 中 心平 台 介 绍 


随 着 互联 网 技术 的 发 展 ， 国 内 应 运 而 生 了 多 种 文献 传递 系统 ， 优 点 是 基于 互联 网 分 布 
技术 ， 既 能 统一 管理 ， 又 便于 各 馆 分 级 接 入 ， 也 方便 读者 提交 、 便 捷 地 获取 文献 。 文 献 传 


递 系统 的 典型 代表 是 高 校 用 户 为 主 的 中 国 高 等 教育 文献 保障 系统 〈 人 简称 CALIS) 和 中 国 高 
校 人 文 社 会 科学 文献 中 心 〈 简 称 CASHL ) 平台 。 除 这 些 全 国 性 系统 外 ， 各 地 区 图 书馆 也 纷 
纷 成 立 联盟 ， 开 发 推出 了 许多 传递 系统 ， 典 型 代表 是 北京 地 区 高 校 图 书馆 文献 资源 保障 体 
系 (BALIS)〉 和 江苏 省 工程 技术 文献 信息 中 心 。 
“江苏 省 工程 技术 文献 信息 中 心 〈 以 下 简称 平台 )“ 是 2004 年 江苏 省 启动 建设 的 四 大 科 
技 公共 基础 服务 平台 之 一 ， 也 是 江苏 区 域 科 技 创新 的 文献 信息 保障 服务 平台 。 平 台 集 成 了 
江苏 省 科技 、 文 化 、 教 育 三 大 系统 的 省 科技 情报 研究 所 、 省 农 科 院 情 报 所 、 省 技术 监督 情 
报 所 、 南 京 图 书馆 、 南 京 大 学 、 东 南大 学 、 南 京 农 业 大 学 、 中 国药 科大 学 、 南 京 医科 大 学 
和 南京 工业 大 学 十 家 单位 现 有 工程 技术 文献 信息 资源 ， 与 国家 科技 图 书 文献 中 心 和 长 三 角 
区 域 文献 信息 资源 的 共享 合作 ， 以 共 知 共享 共 建 的 方式 构建 文献 信息 资源 保障 服务 体系 ， 
联合 向 全 省 开放 服务 。 
文献 传递 过 程 涉及 三 个 环节 : 有 文献 需求 的 用 户 、 文 献 传递 平台 、 值 班 馆 员 。 基 本 杠 
架 如 图 1 所 示 ， 用 户 提交 文献 需求 ， 通 过 文献 传递 平台 把 文献 需求 分 发 给 值班 馆 员 ， 馆 员 
获取 到 文献 信息 ， 通 过 自己 的 专业 知识 和 文献 资源 情况 ， 进 行 检索 ， 获 取 资 源 后 ， 再 通过 
文献 传 平台 提交 文献 ， 文 献 最 终 通 过 文献 传递 平台 呈现 给 用 户 。 
提交 文献 请 求 分 发 任务 
图 1 文献 传递 系统 基本 框架 
为 高 效 运行 ， 平 台 施行 “自动 派 单 ”， 即 系统 自动 分 配 订单 ， 值 班 馆 员 排 队 获取 订单 ， 
先 到 先 得 ， 限 时 完成 。 参 与 传递 工作 的 值班 馆 员 登 录 平台 后 ， 点 击 “ 签 到 ”按钮 ， 按 顺序 
加 入 服务 队列 。 用 户 提 交 的 订单 形成 订单 队列 ， 系 统 按照 顺序 从 订单 队列 指派 订单 给 服务 
队列 中 的 馆 员 ， 并 在 网 页 上 弹出 派 单 提醒 窗口 ， 值 班 馆 员 看 到 提醒 后 点 击 “ 接 单 ” 或 者 
“放弃 ”。 点 击 “ 接 单 ” 后 ， 该 服务 馆 员 自 动 排 在 服务 队列 末尾 ;点击 “放弃 ”， 订 单 顺 
位 派 给 下 一 个 排队 的 馆 员 ， 放 弃 订 单 的 馆 员 自 动 排 在 服务 队列 末尾 。 为 了 保证 派 单 系统 稳 
定 、 有 序 、 高 效 运行 ,平台 限定 中 文 订单 完成 时 间 为 5 min， 外 文 完 成 时 间 为 15 min。 如 
果 不 能 完成 订单 ， 可 以 放弃 ， 被 3 个 不 同 的 人 放弃 的 订单 则 变 为 难题 订单 ”。 
当前 ， 文 献 传 递 依 赖 于 值班 馆 员 ， 其 处 理 是 否 及 时 决定 了 文献 传递 的 时 效 性 。 文 献 需 
求 是 24 小 时 的 ， 而 值班 馆 员 只 能 在 有 限 的 时 间 来 进行 传递 ， 传 递 时 效 性 难以 得 到 保证 。 从 
事 文献 传递 的 馆 员 一 般 都 是 兼职 工作 ， 长 时 间 的 文献 传递 也 会 侵占 工作 时 间 ， 而 且 文献 传 
递 大 多 数 都 是 机 械 的 重复 ， 完 全 可 以 由 程序 自动 化 完成 。 综 上 所 述 ， 即 为 文献 传递 机 器 人 
的 设计 初衷 。 


3. 系统 设计 与 实现 


3. 1 Selenium 框架 的 选择 

Selenium 是 一 个 自动 化 测试 工具 ， 利 用 它 可 以 驱动 浏览 器 执行 特定 的 动作 ， 如 打开 网 
页 ， 抓 取 数 据 等 操作 。 自 动 化 代码 会 调用 Selenium 框架 ， 创 建 相应 的 http 请 求 ， 并 发 送 
给 wepdriver 浏览 器 驱动 ，webdriver 浏览 器 驱动 会 对 请 求 进行 解析 ， 进 而 对 浏览 器 进行 
操控 , 执行 过 程 如 图 2 所 示 。 


i 


Selenium 自 动 化 代码 
创建 一 个 
Http 请 求 


人 webdriver 浏览 器 驱动 


操控 浏览 
器 


内 行 浏览 加 


图 2 Seleniunm 执行 过 程 图 

Selenium 与 BeautifulSoup 和 Scrapy 等 主流 聆 虫 工具 相 比 ， 主 要 区 别 在 于 : 
Selenium 是 一 个 用 于 Web 应 用 程序 测试 的 工具 ， 通 过 调用 相应 浏览 器 的 驱动 程序 ， 模 拟 用 
户 进行 操作 。 而 卜 虫 工具 主要 用 于 收集 数据 ， 疏 虫 工具 发 出 网 络 请 求 时 ， 会 通过 构造 http 
请 求 头 ， 去 指定 页 面 候 取 数据 ， 如 果 网 站 反 和 仆 严 格 ， 可 以 直接 识别 出 仆 虫 ， 从 而 禁止 访问 。 
期 刊 数据 库 这 类 网 站 反扑 尤其 严格 ， 扑 虫 工 具 很 容易 被 限制 。Seleniun 不 属于 候 虫 ， 而 是 
仿真 测试 类 框架 ， 直 接 运 行 在 浏览 器 中 ， 模 拟人 工 操 作 ， 其 访问 频率 和 方式 不 会 对 目标 服 
务 器 造成 额外 负担 ， 也 不 易 被 目标 网 站 限制 ， 非 常 适合 需要 用 户 交 互 的 网 站 ， 例 如 登录 、 
提交 等 各 种 交互 页 面 。 

论文 研究 的 主要 问题 是 自动 化 完成 文献 传递 整个 动作 ， 包 括 在 平台 网 站 领取 任务 ， 再 
去 多 个 检索 网 站 去 检索 信息 、 下 载 并 上 传 。 所 以 ，Seleniun 框架 是 最 理想 的 选择 。 


3.2 系统 功能 设计 

依照 平台 的 文献 传递 流程 ， 文 献 传递 机 器 人 需 实 现 : 平台 登录 、 签 到 、 排 队 、 获 取 订 
单 、 检 索 、 下 载 、 上 传 ， 再 重新 排队 整个 流程 ， 且 全 过 程 无 顷 人 工 值 字 ， 全 部 由 程序 自动 
完成 ， 其 详细 流程 如 图 3 如 所 示 。 
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图 3 系统 流程 图 
3. 3 功能 模块 
(1) 初始 化 和 平台 登陆 
初始 化 主要 是 程序 运行 环境 的 初始 化 ， 包 括 日 志 、 下 载 路 径 、 运 行 环境 路 径 、 存 取 订 
单字 典 、 浏 览 器 驱动 器 的 环境 、 预 先 打开 的 工作 窗口 等 。 平 台 需 要 值班 馆 员 登录 才能 领取 
任务 ， 故 在 程序 初始 化 完成 后 ， 要 实现 平台 登录 功能 。 


次 接 单 或 者 每 次 传递 结束 


(2) 签到 
值班 馆 员 登录 平台 后 ， 先 签到 排队 ， 等 待 平台 分 配 订单 。 首 
再 接 单 ， 需 先 检 测 是 否 签到 ， 如 果 未 签到 ， 则 先进 行 签到 ， 如 果 已 经 是 签到 状态 ， 则 直接 
进行 排队 ， 等 待 派 单 即 可 。 需 要 定义 一 个 函数 获取 签到 状态 ， 签 到 状态 如 果 获 取 成 功 ， 则 
| 返回 False。 关 键 代 码 如 下 : 


返回 签到 状态 ， 如 果 获 取 失 败 ， 贝 


def check sign status(): 


try: 
locator = (By.XPATH, //*[(@id="signBut"]/a') 
WebDriverWait(driver, 10, 0.3).until(EC.presence_ of element located(locator)) 


sign text = driver.find element(By.XPATH, //*[(@id="signBut"]/a').text 


except Exception as e: 
return False 


else: 
return sign text 


(3) 等 待 派 单 
如 果 已 签到 ， 则 交 由 接 retry 函数 ， 每 隔 5S 尝试 一 次 ， 直 到 获 


取 订 单 。 关 键 代 码 如 下 : 


利用 


函数 等 待 派 和 


(@retry(wait_ fixed=5000) 
def order prompt(): 


try: 
driver.find element(By.XPATH., "//*[(@id='orderPrompt']/p[21/a[l1]").click() 


except Exception as e: 


行 签 到 ， 再 等 待 派 单 。 


如 果 未 签到 ， 则 交 由 签到 函数 进 


昌 于 存放 订单 编号 、 订 单 标 题 、 文 献 类 型 、 作 者 、 


(4) 获取 订单 


在 获取 订单 前 ， 先 定义 一 个 字典 ， 月 
来 源 等 订单 信息 。 字 典 表 头 如 下 : 

header = [ 订单 编号 ，“ 订单 标 题 ， 作者 "， “文献 类 型 ，“ 来 源 ，“ 状态， “获取 
订单 时 间 ” ，’ 处 理 完成 时 间 ”] 
再 定义 一 个 函数 ， 用 于 获取 订单 信息 。 关 键 代码 如 下 : 


def delivery_info(): 
delivery info dict = dict() 


try: 
locator = (By.XPATH, //*[(@id="deliveryinfo"|/div[21/div[11/h1/a') 


WebDriverWait(driver, $, 0.5).until(EC.presence_ of element located(locator)) 


delivery info_ dict[I 单 编号 ] = driver.find element(By.XPATH, 
//*[(@id="deliveryinfo"]/div[21]/div[11]/p/span').text 


delivery info_ dict[ 宁 单 标题 ] = driver.find element(By.XPATH, 


\/*[(@id="deliveryinfo"]/div[2]/div[11/h1/a').text 
delivery_info_dict[' 文 献 类 型 ] =\ 
driver.find element(By.XPATH, //*[(@id="deliveryinfo"]/div[2]/div[21/p[21').text.split(” : 
DL-1] 
delivery info_dict[' 作 者 '] = driver.find_element(By.XPATH, 
//*[(@id="deliveryinfo"]/div[2]/div[2]/p[4]/span').text 
delivery_info_dictf' 来 源 | = driver.find element(By.XPATH, 
//*[(@id="deliveryinfo"]/div[2]/div[2]/p[7]/a').text 
except Exception as e: 
return False 
else: 
return delivery_info_dict 


(5) 文献 类 型 的 判断 

如 果 获 取 订 单 为 全 英文 ， 或 者 文献 类 型 为 科技 成 果 、 政 策 法 规 、 产 品 样本 、 科 技 报告 
和 法 律 法 规 ， 则 直接 放弃 ， 结 束 本 次 循环 ， 其 余 订 单 向 下 进入 检索 流程 。 
判断 订单 是 否 为 英文 文献 的 方法 是 检查 标题 是 否 是 全 英文 标题 ， 如 果 是 全 英文 标题 ， 
则 被 视 为 英文 文献 ， 直 接 放弃 。 关 键 代 码 如 下 : 


rt 


defis_contains chinese(strs): 
for_char in strs: 
if \u4e00' <= char <= \u9fa5 ': 
return True 


return False 


为 了 加 快 订 单 的 处 理 效率 ， 文 献 类 型 为 科技 成 果 、 政 策 法 规 、 产 品 样本 、 科 技 报 告 和 
法 律 法 规 的 订单 ， 直 接 放 弃 ， 避 免 进 入 检索 流程 ， 消 耗 检索 时 间 。 关 键 代码 如 下 : 
if (is_contains_ chinese(title) is False) \ 

or (delivery[" 文 献 类 型 ] == ' 科 技 成 果 ') \ 
or (delivery[' 文 献 类 型 ] 一 ' 政 策 法 规 ) \ 
or (delivery[' 文 献 类 型 | 一 ' 产 品 样 本 ') \ 
or (delivery[' 文 献 类 型 | == ' 科 技 报告 ') \ 
or (delivery[ 文 献 类 型 ] == ' 法 律 法 规 ): 

delivery['" 状 态 ] = ' 放 弃 ' 

abandon() 

dict to_csv(delivery) 


continue 

(6) 检索 和 下 载 

文献 类 型 过 滤 结 束 ， 订 单 将 依次 到 四 个 数据 库 进 行 检索 。 如 果 检 索 到 结果 并 下 载 成 功 ， 
将 直接 跳 转 到 上 传 流程 ， 如 果 未 检索 到 结果 或 检索 到 结果 但 没 权限 下 载 ， 则 放弃 订单 ， 结 
束 本 次 循环 。 

以 CNKI 为 例 ， 把 CNKI 高 级 检索 页 面 作为 检索 入 口 ， 首 先 选 择 下 拉 荣 单 并 选择 “篇 名 ” 
然后 输入 “订单 标题 >” 默认 “精确 ”匹配 ， 最 后 点 击 “ 检 索 ” 按 钮 。 检 查 是 否 检索 的 匹配 
文献 ， 如 果 检 索 到 文献 则 下 载 ， 否 则 返回 False。 关 键 代码 如 下 : 


def get _ cnki(delivery title): 
try: 
locator = (By.XPATH, /htmlbody/div[2]/div[3]/div[3]/div[2]/div[1]/div[9]) 
WebDriverWait(driver, 10, 0.3).until(EC.presence of element located(locator)) 
Search = Select( 
driver.find element(By.XPATHL， 
VhtmlMbody/div[2]/div[3]/div[3]J/div[2]J/div[1]/div[2]/span[2]/divselect)) 
search.select_ by _value("TI") 
driver.find element(By.ID, 'txt_1 valuel').send keys(delivery title) 
driver.find element(By.XPATH, /html/body/div[2]/div[3]/div[3]/div[2]/div[11]/div[91).click() 
except Exception as e: 
return False 
else: 
try: 
locator = (By.XPATH, //*[(@id="gridTable"]/div/div[2]/table/tbody/tr/td[91/a[l1]") 
WebDriverWait(driver, 10, 0.3).until(EC.presence_of element located(locator)) 
driver.find element(By.XPATH, 
J/*[(@id="gridTable"]/div/div[2]/table/tbody/tr/td[9]/a[1]").click() 
except Exception as e: 
return False 
else: 
Sleep(9) 


(7) 上 传 

订单 文献 下 载 成 功 后 ， 程 序 将 自动 切换 到 平台 的 订单 上 传 页 面 ， 上 点击“ 立即 上 传 ” 按 
钮 ， 完 成 订单 上 传 。 由 于 平台 的 上 传 对 话 框 是 调用 的 Windows 系统 的 窗口 ， 所 以 ， 实 现 上 
传 需要 调用 Python 的 Win32 库 ，Win32 是 一 种 在 Windows 操作 系统 中 开发 Python 应 用 程 


序 的 工具 包 ， 包 含 了 Win32API 的 模块 、 拓 展 类 型 以 及 一 些 辅助 工具 ， 开 发 者 可 以 通过 这 个 


包 访 问 到 操作 系统 底层 的 API 接口 或 者 编写 Windows 图 像 界面 的 应 用 程序 等 等 功能 。 关 键 
代码 如 下 : 


def upload(file title): 
try: 
locator = (By.XPATH, //*[(@id="deliveryinfo"]/div[21]/div[4]/a[1]') 
WebDriverWait(driver, 10, 0.5).until(EC.presence_of element located(locator)) 
driver.find element(By.XPATH., //*[(@id="deliveryinfo"]/div[2]/div[41]/a[1]').click() 
except Exception as e: 


else: 
sleep(2) 
try: 
locator = (By.XPATH, /html/body/div[9]/div[11]/div[2]/div/div[11]/div/form') 
WebDriverWait(driver, 10, 0.5).until(EC.presence_of element located(locator)) 


driver.find element(By.XPATHL， 
html/body/div[9]/div[1]/div[2]/div/div[1]/div/form'").click() 
except Exception as e: 


else: 

sleep(3) 

try: 
window = win32gui.FindWindow("#32770", "打开 ") 
ComboBoxEx32 = win32gui.FindWindowEx(window, 0, "ComboBoxEx32", None) 
ComboBox = win32gui.FindWindowEx(ComboBoxEx32, 0, "ComboBox", None) 
Edit = win32gul.FindWindowEx(ComboBox, 0, 'Edit', None) 
Button = win32gui.FindWindowEx(window, 0, 'Button', "打开 (&O)") 
win32gui.SendMessage(Edit, win32con.WM SETTEXT, None, file_title) 
sleep(2) 
win32gui.SendMessage(window, win32con.WM COMMAND, 1, Button) 

except Exception as e: 


else: 
sleep(30) 
return True 


3.4 源 数据 库 的 选择 

平台 订单 的 文献 类 型 主要 有 十 种 ， 分 别 为 期 刊 文章 、 学 位 论文 、 专 利 、 会 议论 文 、 科 
技 成 果 、 政 策 法 规 、 产 品 样本 、 科 技 报告 、 法 律 法 规 、 专 著 。 中 文 文献 比较 集中 ， 主 要 来 
源 于 中 国 知 网 (以 下 简称 CNKI)、 万 方 数据 (以 下 简称 万 方 ) 两 大 中 文 数据 库 ， 外 文 文献 
则 较 分 散 ， 大 部 分 来 源 于 : SpringerLink、ScienceDirect、Wiley 等 ， 另 外 ， 还 有 少量 文 
献 来 自 EBSC0、ACS、ProQuest、IEEE、0XFORDJOURNALS 等 外 文 全 文 数据 库 。 

由 于 英文 文献 来 源 多 且 分 散 ， 笔 者 单位 所 购买 的 外 文 数 据 库 种 类 有 限 ， 另 外 ， 国 内 访 
问 外 文 数据 库 延 迟 较 大 ， 且 易 出 错 ， 暂 时 放弃 外 文 数据 库 的 检索 。 
笔者 单位 购买 的 中 文 数据 库 子 库 包 括 期 刊 文章 、 学 位 论文 、 专 利 、 会 议论 文 这 四 大 类 ， 
科技 成 果 、 政 策 法 规 、 产 品 样本 、 科 技 报告 和 法 律 法 规 没有 购买 下 载 权 限 。 所 以 ， 中 文 文 
献 的 处 理 包括 期 刊 文章 、 学 位 论文 、 专 利 、 会 议论 文 四 类 ， 其 余 为 科技 成 果 、 政 策 法 规 、 
产品 样本 、 科 技 报 告 和 法 律 法 规 等 文献 类 型 的 订单 直接 放弃 检索 。 

综 上 所 述 ， 结 合 笔者 单位 购买 数据 库 情况 ， 检 索 的 源 数据 库 选 定 为 四 个 ， 分 别 是 CNKI、 
万 方 、 超 星期 刊 ( 以 下 简称 超星 ) 和 中 华 医学 期 刊 (以 下 简称 中 华 医学 ) 。 其 中 ，CNKI 和 万 方 
文献 的 重 王 率 很 高 ， 包 含 了 期 刊 论文 、 学 位 论文 、 会 议论 文 和 专利 ;中 华 医学 主要 包含 了 
医学 相关 文献 ; 超星 主要 作为 前 三 种 期 刊 的 补充 。 故 检索 的 先后 顺序 为 : CNKI、 万 方 、 超 
星 和 中 华 医 学 。 


4. 运行 与 分 析 
4.1 运行 总 体 情 况 

系统 自 2022 年 11 月 上 线 测试 ， 已 平稳 运行 一 年 ， 论 文 截取 2023 年 11 月 的 订单 数据 
进行 分 析 展 示 ， 其 总 体 概况 如 表 1 所 示 。 


表 1 11 月 订单 完成 概况 


订单 状态 数量 
获取 订单 8261 
完成 的 订单 3392 
未 完成 的 订单 4869 
ee po 


11 月 份 ， 笔 者 账号 在 平台 上 共 获 取 订 单 8261 篇 ， 其 中 完成 了 3392 篇 ， 完 成 占 比 为 
41. 06%。 余 下 4869 篇 为 未 完成 订单 ， 未 完成 订单 主要 有 以 下 三 种 情况 。 

第 一 ， 英 文 文献 。 由 于 国外 数据 库 的 网 速 不 稳定 ， 经 常 导 致 检索 下 载 失 败 ， 故 获取 订 
单 时 ， 先 判断 是 否 未 英文 文献 ， 如 果 为 英文 文献 ， 会 第 一 时 间 放 弃 ， 继 续 下 一 个 订单 的 排 
队 。 主 动 放弃 的 英文 订单 为 1735 篇 ， 英 文 订单 占 总 订单 比例 为 21%。 

第 二 ， 检 索 不 到 的 文献 。 按 订单 标题 先后 在 CNKI、 万 方 、 超 星 和 中 华 医学 四 个 数据 库 
中 检索 ， 如 果 四 个 数据 库 种 都 没有 检索 到 ， 则 放弃 本 次 传递 ， 继 续 下 一 个 订单 的 排队 。 

第 三 ， 可 以 检索 到 ， 但 无 权 下 载 的 文献 。 订 单 文献 可 以 检索 到 ， 但 由 于 笔者 所 在 单位 
未 购买 相应 的 版 权 ， 无 法 下 载 ， 则 放弃 本 次 传递 ， 继 续 下 一 个 订单 的 排队 。 


4.2 来 源 数据 库 分 布 

11 月 份 ，8261 篇 订单 来 源 数据 库 分 布 如 图 4 所 示 ， 其 中 23% 的 订单 在 CNKI 中 完成 ， 
11% 的 订单 在 万 方 中 完 成 ，1% 的 订单 在 超星 中 完成 ，6% 的 订单 在 中 华 医 学 中 完成 ， 最 后 
59% 的 订单 在 四 个 数据 库 中 都 无 法 获取 到 ， 选 择 放 弃 。 


放弃 
59% 


国 CNKI 目 万 方 @ 超星 @ 中 华 医学 @ 放弃 


图 4 来 源 数据 库 分 布 
4.3 每 日 获取 订单 与 完成 情况 
11 月 份 ， 每 日 获取 订单 数量 和 完成 率 如 图 5 所 示 ， 平 均 每 日 获取 订单 275 篇 ， 平 均 完 
成 订单 113 篇 ， 完 成 率 稳定 在 41% 左 右 。 
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EEEEE 获取 订单 总 数 EEEE 完成 总 量 一 -一 完成 率 


5 每 日 获取 订单 数量 和 完成 率 


4 4 时 间 段 统计 与 分 析 


11 月 份 ， 订 单 时 间 段 统计 如 图 6 所 示 ， 订 单 需求 集中 分 布 在 8-22 点 之 间 ， 其 中 呈现 
两 次 高 峰 ， 分 别 在 10-11 点 、15-17 点 ， 订 单 需求 的 时 间 段 分 布 符合 科研 人 员 的 作 妃 时 间 。 
另外 ， 从 图 6 也 可 以 看 出 ， 订 单 需 求 是 24 小 时 的 ， 尤 其 是 非 工作 时 间 ， 文 献 传递 机 器 人 都 


能 做 到 第 一 时 间 相 应 ， 保 证 了 传递 的 时 效 性 。 
800 
700 
600 
虽 500 
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时 间 段 
目 获取 订单 总 数目 完成 总 量 


6 按时 段 统计 的 订单 获取 和 完成 量 分 布 图 


4.5 订单 处 理 时 长 与 分 析 
11 月 份 ， 订 单 处 理 时 长 统计 如 图 7 所 示 ， 其 中 处 理 时 长 为 0 的 订 
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有 1858 篇 ， 包 括 


60.00% 


50.00% 


40.00% 


30.00% 


20.00% 


10.00% 


= 0.00% 


1735 篇 英文 订单 ， 余 下 123 篇 为 异常 订单 ， 直 接 放 弃 ， 未 进出 处 理 流程 ， 故 耗 时 为 0。 正 


常 的 6403 篇 订单 的 处 理 时 长 集中 分 布 在 41-81 秒 之 间 ， 其 中 出 现 5 次 高 峰 ， 


流程 图 中 四 个 数据 库 的 五 个 检索 下 载 阶段 ， 先 后 分 别 为 CE、 万 方 期 刊 、 万 方 专利 、 超 星 


分 别 对 应 图 3 


和 中 华 医学 。 平 台 要 求 订 单 处 理 时 长 不 超过 5 分 钟 ， 最 长 订单 为 2 分 30 秒 ， 不 但 满足 平台 


对 订单 处 理 时 长 的 要 求 ， 在 加 速 订单 处 理 的 同时 ， 还 解放 了 值班 馆 员 的 时 间 。 
2000 


1800 


订单 数量 


1 el Ed el Ed wl mil mh el ed ri Ei ri 


处 理 时 长 
图 7 按 处 理 时 长 订单 分 布 图 


5. 结语 
目前 ， 文 献 传递 机 器 人 还 不 能 完全 取代 人 工 传递 ， 原 因 如 下 ; 


(1) 用 户 提 交 的 订单 信息 不 标准 ， 标 题 和 数据 库 检索 到 的 信息 不 能 完全 匹配 。 


(2) ”文献 复杂 ， 需 要 人 工 核对 ， 比 如 ， 简 单 的 标题 可 能 会 检索 出 多 个 结果 。 


这 些 情况 导致 简单 的 标题 匹配 并 不 能 完全 满足 订单 的 要 求 ， 需 要 加 入 人 1] 


错 ， 才 能 保证 每 一 笔 订单 的 顺利 完成 。 


[的 判断 和 纠 


尽管 如 此 ， 文 献 传递 机 器 人 仍 可 在 文献 传递 中 发 挥 重要 作用 ， 不 仅 可 以 提高 文献 传递 
效率 ， 节 省 人 力 投入 ， 还 可 以 扩展 服务 时 间 。 建 议 工 程 文献 中 心 改 进 文 献 派 单 策略 ， 普 通 


订单 先 交 由 各 个 高 校 的 文献 传递 机 器 人 自动 完成 ， 所 有 单位 都 检索 失败 后 ， 再 
交 由 各 个 单位 的 传递 馆 员 人 工 查 找 。 这 样 既 节省 了 人 力 ， 也 提高 了 传递 效率 ， 
有 更 多 的 精力 放 在 英文 文献 等 难 查 的 文献 上 ， 而 不 是 一 味 的 追求 传递 的 文献 量 。 
文献 传递 机 器 人 也 可 以 推广 到 更 多 的 文献 传递 领域 和 相关 场景 。 
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